16.3.2 Grounding DINO: 언어적 맥락을 반영한 고성능 객체 탐지